Clasificación de textos adaptada para Conversión de Texto en Habla Multidominio
نویسندگان
چکیده
This paper introduces a text classification system tuned to cope with the requirements of multi-domain text-to-speech synthesis. This method, based on a previous system which represents texts by means of a weighted graph, has been developed to improve the classification efficiency for small texts and to minimize its computational cost. To that effect, the comparison space is built from the input text instead of being built from the training documents. Classification experiments conducted on an advertising text corpus show the achievement of the posed goals.
منابع مشابه
Clasificación de actos de habla en diálogos basada en los verbos de habla
Resumen. En este artículo presentamos la clasificación de los actos de habla para el manejo de diálogos que usa como base la clasificación de los verbos de habla presente en los lenguajes naturales. Consideramos dos clasificaciones de los verbos de habla en español y realizamos su comparación. Observamos que a pesar de las diferencias en los niveles altos de las clasificaciones, los niveles baj...
متن کاملClasificación semántica de textos no estructurados mediante un enfoque evolutivo
Resumen. En la actualidad, cerca del 90% de la información se encuentra plasmada tanto en documentos estructurados como no estructurados. Esto ha dado impulso a la investigación e implementación de diferentes algoritmos para el análisis y clasificación de textos de acuerdo a su orientación semántica. Por ello, en el presente trabajo se describe una manera de clasificación de textos no estructur...
متن کاملPresentación sinóptica de textos bilingües mediante distancias de edición
Resumen Aunque la alineación de textos multilingües mediante métodos de traducción estadística consigue buenos resultados, su implementación es compleja y su fundamentación teórica es, a menudo, intrincada. En el caso de textos escritos en idiomas emparentados (por ejemplo, el latín y el castellano) hemos conseguido resultados satisfactorios usando programas muy simples basados en la distancia ...
متن کاملCodificación (s, c)-Densa: optimizando la compresión de texto en lenguaje natural
Resumen Este trabajo presenta un nuevo método para la compresión de textos, que permite la búsqueda directa de palabras y frases dentro del texto sin necesidad de descomprimirlo. Este método es directamente comparable, en tasa de compresión, con las técnicas basadas en Huffman orientadas a palabras y proporciona una compresión más simple y rápida, manteniendo sus caracteŕısticas más destacables...
متن کاملArquitectura para conversión texto-habla multidominio
this paper presents an evolution in the design of multi-domain unit selection text-to-speech (MD-TTS) architecture. The goal of this approach is to achieve good synthetic quality like the limited domain TTS systems, without discarding a general purpose synthesis. The multi-domain architecture entails a speech corpus containing several domains. Moreover, it has been hierarchically structured by ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 37 شماره
صفحات -
تاریخ انتشار 2006